
2015年1月5日,央行發(fā)文,要求騰訊征信、芝麻信用等八家機(jī)構(gòu)做好個(gè)人征信業(yè)務(wù)的準(zhǔn)備工作,準(zhǔn)備時(shí)間為6個(gè)月。這表明,個(gè)人征信市場(chǎng)正式向互聯(lián)網(wǎng)企業(yè)開(kāi)放。享受此次征信開(kāi)放業(yè)務(wù)的由8家機(jī)構(gòu)承擔(dān),分別是芝麻信用管理有限公司、騰訊征信有限公司、深圳前海征信中心股份有限公司、鵬元征信有限公司、中誠(chéng)信征信有限公司、中智誠(chéng)征信有限公司、拉卡拉信用管理有限公司、北京華道征信有限公司。

什么是個(gè)人和企業(yè)征信
所謂征信,就是專業(yè)化的、獨(dú)立的第三方機(jī)構(gòu)為個(gè)人或企業(yè)建立信用檔案,依法采集、客觀記錄其信用信息,并依法對(duì)外提供信用信息服務(wù)的一種活動(dòng),它為專業(yè)化的授信機(jī)構(gòu)提供了一個(gè)信用信息共享的平臺(tái)。征信的數(shù)據(jù)要素主要包括三個(gè)方面。一是個(gè)人基本信息,包括姓名、證件類(lèi)型及號(hào)碼、通訊地址、聯(lián)系方式、婚姻狀況、居住信息、職業(yè)信息等;二是信用交易信息,包括信用卡信息、貸款信息、其他信用信息;三是其他信息,包括查詢記錄等。
當(dāng)前,由中國(guó)人民銀行組織商業(yè)銀行建成的企業(yè)和個(gè)人征信系統(tǒng),已經(jīng)為全國(guó)1300多萬(wàn)戶企業(yè)和近6億自然人建立了信用檔案。這也就是說(shuō),這些企業(yè)和個(gè)人從事經(jīng)濟(jì)金融活動(dòng)的信用狀況將被記錄到“經(jīng)濟(jì)身份證”上,成為與企業(yè)和個(gè)人永遠(yuǎn)相伴的檔案。如果逾期還貸或有其他違反合同的規(guī)定,那么“經(jīng)濟(jì)身份證”將被抹上灰色的一筆,今后向銀行申請(qǐng)貸款就可能面臨更加謹(jǐn)慎和挑剔的目光。
征信服務(wù)遭遇的數(shù)據(jù)瓶頸
當(dāng)前,網(wǎng)購(gòu)已經(jīng)觸及到社會(huì)經(jīng)濟(jì)行為的各個(gè)角落,以P2P為代表的互聯(lián)網(wǎng)金融正在對(duì)傳統(tǒng)金融行業(yè)發(fā)起沖擊,基于網(wǎng)絡(luò)的互聯(lián)網(wǎng)經(jīng)濟(jì)成為一個(gè)重要的經(jīng)濟(jì)形勢(shì),而主體虛擬化的交易方式使得信用的重要性越來(lái)越突出,于是征信業(yè)務(wù)作用性越發(fā)迫切。與此同時(shí),互聯(lián)網(wǎng)發(fā)展給個(gè)人征信行業(yè)帶來(lái)了跳躍式的發(fā)展。隨著互聯(lián)網(wǎng)的發(fā)展,人的行為變成24小時(shí)可記錄,這就導(dǎo)致跟傳統(tǒng)征信業(yè)的數(shù)據(jù)相比,互聯(lián)網(wǎng)征信的數(shù)據(jù)涉及范圍更廣,種類(lèi)更多。因此,傳統(tǒng)的征信模式很難實(shí)現(xiàn)大數(shù)據(jù)時(shí)代的要求,大數(shù)據(jù)征信是征信體系的發(fā)展趨勢(shì)。
從互聯(lián)網(wǎng)征信的特征來(lái)看,其獲取的主要是信息主體在線上的行為數(shù)據(jù),包括網(wǎng)上的交易數(shù)據(jù)、社交數(shù)據(jù)以及其他互聯(lián)網(wǎng)服務(wù)使用中產(chǎn)生的行為數(shù)據(jù)等,甚至可以是在信息主體之外的第三方評(píng)價(jià)、信用口碑等信息。這些代表信息主體的互聯(lián)網(wǎng)行為軌跡和細(xì)節(jié)更多反映人的性格、心理等更加本質(zhì)的信息,都可以用來(lái)對(duì)信息主體的信用狀況進(jìn)行推斷。
然而,隨著互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代的到來(lái),傳播與網(wǎng)上的數(shù)據(jù)信息增量驚人。有數(shù)據(jù)顯示,阿里芝麻信用信用數(shù)據(jù)日處理量在30P B以上,相當(dāng)于5000個(gè)國(guó)家圖書(shū)館的數(shù)據(jù)總量,其中包含了用戶網(wǎng)購(gòu)、還款、轉(zhuǎn)賬以及個(gè)人信息等方方面面數(shù)據(jù)。而與互聯(lián)網(wǎng)上傳播的日數(shù)據(jù)量相比,阿里芝麻信用的這些數(shù)據(jù)真算是九牛一毛。面對(duì)分布在各種平臺(tái)、網(wǎng)站、社區(qū)、數(shù)據(jù)庫(kù)的數(shù)據(jù)量龐大的,甚至是零散、零碎的征信建設(shè)可用數(shù)據(jù)信息,如何實(shí)現(xiàn)這些信息數(shù)據(jù)的收集、清洗、匯總,也算是當(dāng)前互聯(lián)網(wǎng)個(gè)人及企業(yè)征信建設(shè)的一個(gè)瓶頸了。
在業(yè)內(nèi)看來(lái),無(wú)論是阿里還是騰訊,布局征信業(yè)務(wù)主要優(yōu)勢(shì)在于手上握有的大數(shù)據(jù)。但是,面對(duì)抓取阿里生態(tài)圈外數(shù)據(jù)的瓶頸,阿里芝麻也只能通過(guò)購(gòu)買(mǎi)或者合作等方式采集外部數(shù)據(jù),包括政府機(jī)構(gòu)數(shù)據(jù)以及金融機(jī)構(gòu)數(shù)據(jù)等來(lái)彌補(bǔ)互聯(lián)網(wǎng)征信在數(shù)據(jù)上的不足。于是,在自有生態(tài)圈外實(shí)現(xiàn)個(gè)人和企業(yè)信用信息的采集、整理、保存、加工工作,已經(jīng)成為互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代征信建設(shè)必須要突破的困局。
信息采集打破征信數(shù)據(jù)“貧窮”困局
互聯(lián)網(wǎng)時(shí)代,每天存在于網(wǎng)絡(luò)的數(shù)據(jù)數(shù)以億萬(wàn)計(jì),這些數(shù)據(jù)中包含著個(gè)人或企業(yè)的基本身份信息,工作情況,消費(fèi)記錄,興趣愛(ài)好信息,口碑狀況,犯罪記錄,社交圈狀況等等,它們都可以作為征信建設(shè)的重要依據(jù)要素。但是,這些數(shù)據(jù)同時(shí)又表現(xiàn)出互聯(lián)網(wǎng)信息普遍存在的傳播性、即時(shí)性、零散性和雜亂性,這些特點(diǎn)都大大增加了傳統(tǒng)人工數(shù)據(jù)收集的困難,也不利于海量數(shù)據(jù)的清洗。
在此背景下,以互聯(lián)網(wǎng)開(kāi)源信息作為抓取對(duì)象的網(wǎng)絡(luò)數(shù)據(jù)自動(dòng)化采集系統(tǒng)走入人們的視線。以當(dāng)前信息采集行業(yè)知名品牌樂(lè)思信息采集系統(tǒng)為例,其主要根據(jù)用戶自定義的任務(wù)配置,批量而精確地抽取因特網(wǎng)目標(biāo)網(wǎng)頁(yè)中的半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),轉(zhuǎn)化為結(jié)構(gòu)化的記錄,保存在本地?cái)?shù)據(jù)庫(kù)中,用于內(nèi)部使用或外網(wǎng)發(fā)布,快速實(shí)現(xiàn)外部信息的獲取。而自動(dòng)獲取的數(shù)據(jù)涵蓋文本信息、URL、數(shù)字、日期、圖片、音頻、視頻、快照等各種類(lèi)別,主要應(yīng)用于公關(guān)效果監(jiān)測(cè),品牌監(jiān)測(cè),價(jià)格監(jiān)測(cè),門(mén)戶網(wǎng)站新聞采集,行業(yè)資訊采集,競(jìng)爭(zhēng)情報(bào)獲取,商業(yè)數(shù)據(jù)整合,市場(chǎng)研究,數(shù)據(jù)庫(kù)營(yíng)銷(xiāo)等領(lǐng)域。對(duì)于征信建設(shè)而言,其在網(wǎng)絡(luò)信息數(shù)據(jù)自動(dòng)化獲取和清理方面作用突出。

以企業(yè)征信系統(tǒng)建設(shè)中的企業(yè)口碑狀況和違法記錄為例。比如想建立萬(wàn)科的征信檔案,通過(guò)樂(lè)思網(wǎng)絡(luò)信息采集系統(tǒng),可以以全網(wǎng)作為數(shù)據(jù)抓取對(duì)象,采集各類(lèi)涉及萬(wàn)科的言論信息,包括網(wǎng)友跟帖、新聞報(bào)道、產(chǎn)品評(píng)價(jià)、營(yíng)業(yè)情況等,然后通過(guò)后臺(tái)的數(shù)據(jù)自動(dòng)化分類(lèi)聚類(lèi)實(shí)現(xiàn)數(shù)據(jù)的清洗,得出萬(wàn)科相關(guān)的公眾口碑度、媒體關(guān)注度、產(chǎn)品好評(píng)度等數(shù)據(jù)表,以此作為萬(wàn)科信用評(píng)分的參照要素之一,從而保證對(duì)一個(gè)企業(yè)信用標(biāo)準(zhǔn)評(píng)判的科學(xué)化、精細(xì)化和精準(zhǔn)化。同時(shí),這種征信參照數(shù)據(jù)的完整性,也提高了企業(yè)信用在金融貸款、經(jīng)濟(jì)交往中的說(shuō)服力。
再比如,企業(yè)的違法記錄對(duì)于企業(yè)信用度評(píng)判的高度作用是毋容置疑的。然而,面對(duì)分布在各級(jí)各大法院數(shù)據(jù)庫(kù)里相對(duì)孤立的巨量企業(yè)違法信息,一是難以實(shí)時(shí)全面收集,二是即使通過(guò)人工收集,也難以做好數(shù)據(jù)的清洗,其工作量和人工成本巨大難以想象。而信息數(shù)據(jù)采集則很好的化解了這一難題。例如樂(lè)思網(wǎng)絡(luò)信息采集系統(tǒng)則可以一次性并且實(shí)時(shí)跟蹤自動(dòng)采集分散在各大法院官網(wǎng)的企業(yè)違法數(shù)據(jù),集中入庫(kù),再通過(guò)系統(tǒng)的自動(dòng)聚類(lèi)分類(lèi)功能,以企業(yè)或者違法類(lèi)型為對(duì)象對(duì)入庫(kù)數(shù)據(jù)實(shí)現(xiàn)信息自動(dòng)清洗,最終完成企業(yè)違法記錄數(shù)據(jù)庫(kù),依據(jù)需要納入企業(yè)征信系統(tǒng)。
其實(shí),不管是企業(yè)征信建設(shè)還是個(gè)人征信建設(shè),其本質(zhì)是數(shù)據(jù),如何獲得全面、及時(shí)、有效的數(shù)據(jù),直接決定了征信建設(shè)在未來(lái)經(jīng)濟(jì)活動(dòng)中的作用和意義。信用數(shù)據(jù)判定要素越豐富、全面、準(zhǔn)確,那么通過(guò)信用度來(lái)考量經(jīng)濟(jì)交往中的風(fēng)險(xiǎn)也就越科學(xué)、越精準(zhǔn)。因此,面對(duì)大數(shù)據(jù)需求與網(wǎng)絡(luò)信息“孤島”的矛盾,信息數(shù)據(jù)大采集為征信建設(shè)提供了渠道。
自貢公安局交警輿情工作啟示
大數(shù)據(jù)環(huán)境下CIO企業(yè)信息化建設(shè)方法
新媒體時(shí)代下微信輿情該如何監(jiān)控?
網(wǎng)絡(luò)大數(shù)據(jù)挖掘如何促進(jìn)防災(zāi)減災(zāi)工作?
電力企業(yè)如何做好網(wǎng)絡(luò)輿情監(jiān)控管理